智能论文笔记

Generalized Two Color Map Theorem -- Complete Theorem of Robust Gait Plan for a Tilt-rotor

Zhe Shen , Yudong Ma , Takeshi Tsuchiya

分类：机器人

2022-06-27

步态计划是一种通常应用于地面机器人的过程，例如四足机器人； Tilt-Rotor是一种新型的四型四个输入，不是其中之一。在控制倾斜 - 依赖反馈线性化的倾斜旋转时，预计倾斜角度（输入）将过度改变，这在应用程序中可能不会预期。为了帮助抑制倾斜角度的密集变化，在反馈线性化之前，将步态计划程序引入倾斜度。用户提前时间指定倾斜角度，而不是由控制规则给出。但是，基于这种情况，反馈线性化中的去耦矩阵对于某些态度，滚动角度和螺距角的组合可能是单数的。它阻碍了反馈线性化的进一步应用。因此，建立了两个彩色图定理，以最大程度地提高可接受的态度区域，在该区域中，滚动和音高的组合将产生可逆的去耦矩阵。然而，该定理过度限制了倾斜角度的选择，这可以排除一些可行的健壮步态。本文给出了广义的两个彩色图定理。所有健壮的步态都可以根据这种广义定理找到。分析了满足该广义的两个彩色图定理（违反两个彩色图定理）的三个步态的鲁棒性。结果表明，概括的两个颜色图定理完成了对倾斜旋转的稳健步态的搜索。

translated by 谷歌翻译

The Robust Gait of a Tilt-rotor and Its Application to Tracking Control -- Application of Two Color Map Theorem

Zhe Shen , Takeshi Tsuchiya

分类：机器人

2022-06-22

Rylls Tilt-Rotor是无人机，有八个输入；可以根据控制规则指定推力的四个大小以及推力的四个倾斜角。尽管取得了模拟的成功，但常规反馈线性化证明了投入的过度变化，同时适用于稳定Rylls倾斜旋转。因此，我们以前的研究将额外的步态计划提交了额外的程序，以抑制倾斜角度的意外变化。伴随两个颜色地图定理，倾斜角度是坚定而连续的。设计的步态对态度的改变是可靠的。但是，在进一步应用跟踪模拟测试之前，这不是一个完整的理论。本文进一步讨论了两个颜色图定理之后的一些步态，并模拟了倾斜旋转的跟踪问题。均匀的圆形移动参考设计为由配备了设计健壮步态和反馈线性化控制器的倾斜旋转器跟踪。满足两个彩色图定理的步态显示了鲁棒性。模拟的结果显示了跟踪倾斜旋转的成功。

translated by 谷歌翻译

Gait Analysis for A Tilt-rotor: The Dynamic Invertible Gait

Zhe Shen , Takeshi Tsuchiya

分类：机器人

2022-01-05

反馈线性化是一种用于控制倾斜转子的流行控制方法。尽管该方法带来了利用系统过度致动的性能的机会，但典型的结果表明倾斜角度的大变化，这在实际情况下不期望。为了解决这个问题，我们介绍了新颖的概念UAV步态来限制倾斜角度。步态计划问题最初是为了解决四肢（四足腿）机器人的控制问题。在移植这种方法的同时，伴随着反馈线性化方法，在倾斜转子可能导致解耦矩阵中的众所周知的非可逆问题。在这项研究中，我们探讨了倾斜转子的可逆步态，并应用反馈线性化以稳定姿态和高度。结果在Simulink，Matlab中验证。

translated by 谷歌翻译

Efficient Joint Detection and Multiple Object Tracking with Spatially Aware Transformer

Siddharth Sagar Nijhawan , Leo Hoshikawa , Atsushi Irie , Masakazu Yoshimura , Junji Otsuka , Takeshi Ohashi

分类：计算机视觉

2022-11-09

We propose a light-weight and highly efficient Joint Detection and Tracking pipeline for the task of Multi-Object Tracking using a fully-transformer architecture. It is a modified version of TransTrack, which overcomes the computational bottleneck associated with its design, and at the same time, achieves state-of-the-art MOTA score of 73.20%. The model design is driven by a transformer based backbone instead of CNN, which is highly scalable with the input resolution. We also propose a drop-in replacement for Feed Forward Network of transformer encoder layer, by using Butterfly Transform Operation to perform channel fusion and depth-wise convolution to learn spatial context within the feature maps, otherwise missing within the attention maps of the transformer. As a result of our modifications, we reduce the overall model size of TransTrack by 58.73% and the complexity by 78.72%. Therefore, we expect our design to provide novel perspectives for architecture optimization in future research related to multi-object tracking.

translated by 谷歌翻译

What Do Deep Neural Networks Find in Disordered Structures of Glasses?

Norihiro Oyama , Shihori Koyama , Takeshi Kawasaki

分类：机器学习

2022-07-31

在一系列软物质系统中广泛观察到玻璃过渡。但是，尽管有多年的研究，这些转变的物理机制仍然未知。特别是，一个重要的未解决的问题是玻璃转变是否伴随着特征静态结构的相关长度的分歧。最近，提出了一种可以从纯精度的纯静态信息中预测长期动态的方法。但是，即使是这种方法也不通用，并且对于KOB（Andersen系统）而言，这是典型的玻璃形成液体模型。在这项研究中，我们开发了一种使用机器学习或尤其是卷积神经网络提取眼镜的特征结构的方法。特别是，我们通过量化网络做出的决策的理由来提取特征结构。我们考虑了两个质量不同的玻璃形成二进制系统，并通过与几个既定结构指标进行比较，我们证明我们的系统可以识别依赖于系统细节的特征结构。令人惊讶的是，提取的结构与热波动中的非平衡衰老动力学密切相关。

translated by 谷歌翻译

Learning Pseudo Front Depth for 2D Forward-Looking Sonar-based Multi-view Stereo

Yusheng Wang , Yonghoon Ji , Hiroshi Tsuchiya , Hajime Asama , Atsushi Yamashita

分类：计算机视觉 | 机器人

2022-07-30

从2D前看声纳中检索声学图像中缺少的维度信息是水下机器人技术领域的一个众所周知的问题。有一些尝试从单个图像中检索3D信息的作品，该信息允许机器人通过飞行运动生成3D地图。但是，由于独特的图像配方原理，估计来自单个图像的3D信息面临严重的歧义问题。多视图立体声的经典方法可以避免歧义问题，但可能需要大量的观点来生成准确的模型。在这项工作中，我们提出了一种基于学习的新型多视角立体方法来估计3D信息。为了更好地利用来自多个帧的信息，提出了一种高程平面扫平方法来生成深度 - 齐路的成本量。正则化后的体积可以视为目标的概率体积表示。我们使用伪前深度来代表3D信息，而不是在高程角度上进行回归，而是可以避免声学成像中的2d-3d问题。只有两个或三个图像可以生成高准确的结果。生成合成数据集以模拟各种水下目标。我们还在大型水箱中构建了第一个具有准确地面真相的真实数据集。实验结果证明了与其他最新方法相比，我们方法的优势。

translated by 谷歌翻译

Best-of-Both-Worlds Algorithms for Partial Monitoring

Taira Tsuchiya , Shinji Ito , Junya Honda

分类：机器学习 | (统计)机器学习

2022-07-29

本文考虑了$ k $ actions和$ d $ outcomes的部分监测问题，并提供了第一个最佳世界世界算法，其遗憾是在随机制度中的多层次，在随机状态下，在对抗性中近乎看法。政权。更具体地说，我们证明对于非分类本地可观察的游戏，随机制度中的遗憾是由$ o（k^3 m^2 \ log（t）\ log（k _ {\ pi} t） / \ delta _ {\ mathrm {\ min}}）$，在$ o（k^{2/3} m \ sqrt {t \ log（t）\ log k _ {\ log k _ {\ pi}}}）$中，在对抗状态下$ t $是回合的数量，$ m $是每个动作不同观察值的最大数量，$ \ delta _ {\ min} $是最小的最佳差距，$ k _ {\ pi} $是帕累托的最佳数量动作。此外，我们表明，对于非分类全球可观察的游戏，随机制度中的遗憾是由$ o（\ max \ {c _ {c _ {\ Mathcal {g}}}}^2 / k，\，c _ { }}} \} \ log（t）\ log（k _ {\ pi} t） / \ delta _ {\ min}^2）$，在$ o（\ max \ {c _ { }}}^2/k，\，c _ {\ mathcal {g}}} \} \ log（t）\ log（k _ {\ pi} t）））^{1/3} t} t^{2/3}） $，其中$ c _ {\ Mathcal {g}} $是游戏依赖的常数。我们的算法基于以下规范化领导者框架，该框架考虑了部分监视问题的性质，灵感来自在线学习领域中使用反馈图的算法。

translated by 谷歌翻译

Robustifying Vision Transformer without Retraining from Scratch by Test-Time Class-Conditional Feature Alignment

Takeshi Kojima , Yutaka Matsuo , Yusuke Iwasawa

分类：计算机视觉 | 人工智能 | 机器学习

2022-06-28

Vision Transformer（VIT）在图像处理中变得越来越流行。具体而言，我们研究了测试时间适应（TTA）对VIT的有效性，VIT是一种已经出现的技术，可以自行纠正其在测试时间期间的预测。首先，我们在VIT-B16和VIT-L16上基准了各种测试时间适应方法。结果表明，使用适当的损耗函数时，TTA对VIT有效，并且先前的投入（明智地选择调制参数）是不需要的。基于观察结果，我们提出了一种称为类条件特征对齐（CFA）的新的测试时间适应方法，该方法将类别条件分布的差异和在线源中隐藏表示的整个分布差异最小化，在线中的整个分布差异方式。图像分类任务（CIFAR-10-C，CIFAR-100-C和Imagenet-C）和域适应性（Digits DataSet和Imagenet-Sketch）的实验表明，CFA稳定地超过了各种数据集中的现有基础。我们还通过在RESNET，MLP混合和几种VIT变体（Vit-augreg，Deit和Beit）上实验来验证CFA是模型不可知论。使用BEIT主链，CFA在Imagenet-C上达到了19.8％的TOP-1错误率，表现优于现有的测试时间适应基线44.0％。这是不需要改变训练阶段的TTA方法中的最新结果。

translated by 谷歌翻译

Noise-aware Physics-informed Machine Learning for Robust PDE Discovery

Pongpisit Thanasutives , Takeshi Morita , Masayuki Numao , Ken-ichi Fukui

分类：人工智能 | 机器学习

2022-06-26

这项工作与发现物理系统的偏微分方程（PDE）有关。现有方法证明了有限观察结果的PDE识别，但未能保持令人满意的噪声性能，部分原因是由于次优估计衍生物并发现了PDE系数。我们通过引入噪音吸引物理学的机器学习（NPIML）框架来解决问题，以在任意分布后从数据中发现管理PDE。我们的建议是双重的。首先，我们提出了几个神经网络，即求解器和预选者，这些神经网络对隐藏的物理约束产生了可解释的神经表示。在经过联合训练之后，求解器网络将近似潜在的候选物，例如部分衍生物，然后将其馈送到稀疏的回归算法中，该算法最初公布了最有可能的PERSIMISIAL PDE，根据信息标准决定。其次，我们提出了基于离散的傅立叶变换（DFT）的Denoising物理信息信息网络（DPINNS），以提供一组最佳的鉴定PDE系数，以符合降低降噪变量。 Denoising Pinns的结构被划分为前沿投影网络和PINN，以前学到的求解器初始化。我们对五个规范PDE的广泛实验确认，该拟议框架为PDE发现提供了一种可靠，可解释的方法，适用于广泛的系统，可能会因噪声而复杂。

translated by 谷歌翻译

Aggregated Multi-output Gaussian Processes with Knowledge Transfer Across Domains

Yusuke Tanaka , Toshiyuki Tanaka , Tomoharu Iwata , Takeshi Kurashima , Maya Okawa , Yasunori Akagi , Hiroyuki Toda

分类： (统计)机器学习 | 机器学习

2022-06-24

汇总数据通常出现在社会经济和公共安全等各个领域。汇总数据与点不关联，而与支持（例如，城市中的空间区域）相关联。由于支撑物可能取决于属性（例如贫困率和犯罪率），因此对此类数据进行建模并不直接。本文提供了一个多输出高斯流程（MOGP）模型，该模型使用各自粒度的多个聚合数据集侵入属性的功能。在提出的模型中，每个属性的函数被认为是建模为独立潜在GPS的线性混合的依赖GP。我们设计一个具有每个属性聚合过程的观察模型；该过程是GP在相应支持上的组成部分。我们还引入了混合权重的先验分布，该分布可以通过共享先验来跨域（例如城市）进行知识转移。在这种情况下，这是有利的，因为城市中的空间汇总数据集太粗糙而无法插值。提出的模型仍然可以通过利用其他城市中的聚合数据集来准确地预测属性。提出的模型的推断是基于变异贝叶的，它使人们能够使用来自多个域的聚合数据集学习模型参数。该实验表明，所提出的模型在改善现实世界数据集上的粗粒骨料数据的任务中胜过：北京的空气污染物的时间序列以及来自纽约市和芝加哥的各种空间数据集。

translated by 谷歌翻译